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HE: [B 48] P 443 Anopheles sinensis 是 我 国 及 东南 亚 重要 的 传 症 媒 介 。 本 研究 在 全 基因 组 上 
鉴定 和 分 析 中 华 按 蚂 微 卫星 并 注释 微 卫 星相 关 基 因 的 功能 ,为 遗传 分 子 标记 的 篇 选 提供 依据 ,也 为 
昆虫 微 卫星 比较 基因 组 学 进一步 研究 提供 基础 。【 方 法 ] 用 MSA 程序 鉴定 中 华 按 竖 基 因 组 微 卫 
星 ;用 Excel 2010 统计 微 卫 星 长 度 , 结 合 微 卫星 序列 信息 编写 Perl Pp ECT. E AREA XM 
微 卫 星 位 置信 息 编 写 Perl 脚本 定位 微 卫 星 出 现 的 基因 区 域 ,并 对 基因 区 的 微 卫 星 进 行 GO 功能 注 
释 ;运用 WEGO 比较 中 华 按 蚊 和 冈比亚 按 蚊 An，gambiae 含 微 卫星 相关 基因 功能 注释 。[【 结果 】] 共 
鉴定 出 105 981 个 微 卫 星 , 出现 的 密度 是 365.5 个 /Mb。 其 中 100 391 个 (94.7% ) 微 卫星 是 完整 型 
微 卫 星 , 其 余 5 590 个 (5.3% ) 是 复合 型 微 卫星 。 单 碱 基 微 卫星 最 为 丰富 , 共 58 837 个 , 占 总 微 卫 
星 数量 的 553.5% ,其 余 依 次 是 二 碱 基 (30 345 个 , 占 28.6% )、 三 碱 基 (15 104 个 , 占 14.3% ) 四 碱 
基 (1 530 ^^, 5 1.496) , E 3& (121 个 , 占 0.1% ) 和 六 碱 基 (44 AS, 0.196) f& T. € , (A)n 为 
最 主要 的 微 卫 星 ,其 次 是 (AC)n, (AG)n, (C)n, (AGC)n, (ATC)n, (ACG)n fe( ACC) n, c Ag 
在 2 000 个 以 上 。 中 华 按 蛟 基因 组 微 卫 星 长 度 以 10 ~20 bp 为 主 (87.1% ) 。 这 些微 卫星 的 AT 含 
量 (63% ) 明显 高 于 GC 含量 (37% ) , 仅 三 碱 基 微 卫星 的 GC 含量 (53% ) 略 高 于 AT 含量 (47% ) 。 
90 632 个 微 卫星 (85% ) 分 布 在 基因 间 区 ,15 349 个 (15% ) 微 卫星 分 布 在 基因 区 。 在 基因 区 ,2 782 
个 (3% ) 微 卫星 分 布 在 外 显 子 区 ,12 567 个 (12% ) 分 布 在 内 含 子 区 。GO0O 注释 比较 中 华 按 蚁 和 冈 比 
3E dz 3572 fi E. 22 85 AS ,发 现 这 两 个 物种 各 小 类 基因 所 占 总 基因 数 的 百分比 基本 一 致 ,但 电子 传递 
类 (electron carrier) $ S] 4e P 4 480p 5 8 2: 16(0. 9% ) 明显 高 于 冈比亚 按 归 (0.1% ) 。【 结 论 ] 这 
是 明 忠 中 首 个 在 全 基因 组 上 系统 的 微 卫 星 研究 工作 ,为 进一步 通过 微 卫 星 作为 分 子 标 记 开 展 中 华 
按 蚊 种 群 遗 传 学 .遗传 变异 、 功 能 基因 的 遗传 定位 和 调控 机 制 研 究 芮 定 了 基础 ,也 为 昆虫 微 卫 星 的 
多 样 性 和 进化 研究 积累 了 科学 素材 。 
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Abstract: [ ^im] Anopheles sinensis is an important malaria vector in China and southeastern Asia. The 
study aims to identify and analyze the simple sequence repeats ( SSRs, also called as microsatellites) and 


to annotate the functions of SSR-containing genes in the whole genome of An. sinensis, so as to provide 
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the basis for the selection of molecular genetic markers in An. sinensis and to lay a foundation for further 


studies of the comparative genomics of SSRs in insects. [ Methods] MISA program was used to identify 


SSRs in the An. sinensis genome, and Excel 2010 was used to count the length of SSRs identified. Perl 


scripts were written in the study to calculate the SSHs base content based on the SSR sequence and to 


map the SSRs to the genome based on the SSR location information from SSR identification. WEGO was 


used to carry on the GO function annotation of SSR-containing genes in An. sinensis and An. gambiae. 


[ Results] A total of 105 981 SSRs were identified in the An. sinensis genome, with the genomic density 
of 365. 5 SSRs per Mb. Out of these SSRs, 100 391 (occupying 94. 796 ) are perfect SSRs, and the 
remaining 5 590 (5.396) are compound SSRs. The mononucleotide SSRs (58 837, 55.596) are the 
most abundant, followed by dinucleotide SSRs (30 345, 28. 696), trinucleotide SSRs (15 104, 
14. 396 ) , tetranucleotide SSRs (1 530, 1. 496) , penanucleotide SSRs (121, 0. 196 ) and hexanucletide 
SSRs (44, less than 0. 1% ). The ( A) n SSRs are the most predominant, followed by (AC)n, (AG)n, 
(C)n, (AGC)n, ( ATC) n, (ACG) n and ( ACC) n, and each of these types has more than 2 000 
SSRs. The SSRs of 10 — 20 bp length occupy 87. 1% of the total. Except that the GC-content (5396 ) of 
trinucleotide SSRs is slightly higher than their AT-content, the AT-content (6396) of other SSRs is 
obviously higher than the GC-content (3796 ). And 90 632 (8596) SSRs are located in the intergenic 
region, and 15 349 (1596 ) SSRs in the gene region, of which 2 782 (396 ) SSRs are in the exon region 
and 12 567 (1296) SSRs in the intron region. The comparison of GO functional annotation of SSR- 


containing genes in An. sinensis and An. gambiae showed that the percentages of all subcategories of 


genes are basically similar with each other; the percentage of electron carrier genes in An. sisensis 


( occupying 0. 996 ) , however, is significantly higher than that in An. gambiae (0.196). [Conclusion] 


This is the first systematical research of SSRs in whole genomes of mosquito species. The study lays an 


important basis for the selection of SSRs as biomarkers to carry on the studies of population genetics, 


genelic variation, the genetic location and regulation mechanisms of functional genes, as well as the 


studies on the diversity and evolution of SSRs in insects. 


Key words: Anopheles sinensis; genome; microsatellites; characteristics; distribution; base content; GO 


annotation 





微 卫 星 又 称 简单 序列 重复 (simple sequence 
repeats, SSRs) ,一 般 由 1 ~6 bp BEREZ AJH 
成 ,广泛 存在 于 真 核 和 原核 生物 基因 组 中 。 微 卫星 
是 DNA 复制 时 滑动 突变 或 者 DNA 链 间 的 重组 
( Harding et al., 1992) 产生 的 。 在 基因 中 不 同位 置 
OET. NEFA UTR K) 的 微 卫星 在 蛋白 质 功 
能 .遗传 .基因 调控 和 表达 上 扮演 着 重要 的 作用 























变异 分 析 了 达 氏 按 蚊 An. darlingi, 二 斑 叶 螨 
Tetranychus urticae, 大 蜜蜂 Apis dorsata , Y K t uy 
Aedes aegypti ER ZIR Cydia pomonella 的 种 群 遗 
传 结构 (Scarpassa and Conn, 2007; Carbonnelle et 
al., 2007; Insuan et al., 2007; Lovin et al., 2009; 
Chen and Dorn, 2010) , 


早期 对 微 卫星 的 研究 主要 是 基于 实验 的 鉴定 ， 

















(Lawson and Zhang, 2006), 。 微 卫星 具有 种 内 高 度 
保守 、 共 显 性 遗传 .多 态 性 丰富 和 遗传 连锁 不 平衡 等 
优点 ( 王 永 模 和 沈 优 ,2006 ) ,是 发 展 最 快 的 一 类 分 
子 标记 ,在 群体 遗传 结构 分 析 .遗传 多 样 性 和 特定 基 
因 和 定位 等 方面 具有 广泛 应 用 。 郭 秋 红 等 (2007 ) 应 
用 家 看 Bombyx mori 的 微 卫星 成 功 将 DU 基因 定位 
到 scaffold E; Zheng 等 (1996) 通 过 冈比亚 按 蚊 
Anopheles gambiae 微 卫 星 构 建 了 第 2 号 .第 3 号 和 X 
染色 体 的 遗传 连锁 图 谱 ;一 些 研究 应 用 微 卫 星 位 点 





























过 基因 组 DNA 的 提取 、 转 化 克隆、 特异 探 针 算 选 
来 构建 微 卫 星 富 集 文库 。Chambers 等 (2007 ) 构建 
了 2 个 埃及 伊 蚁 微 卫 星 富 集 文库 ,分 别 用 3 个 和 5 
个 多 态 性 微 卫星 位 点 成 功 地 分 析 了 种 群 遗传 结构 。 
但 该 方法 耗 时 长 ,效率 低 。 随 着 第 二 代 测 序 技术 的 
发 展 ,EST 数据 库 的 获得 , 越 来 越 多 的 物种 基于 EST 
序列 鉴定 了 微 卫 星 , 先后 有 杰 拟 谷 盗 Tribolium 
castaneum , 38; & V Nilaparvata lugens, 家 看 ,村 小 实 
W& Bactrocera dorsalis WR $, Mythimna separata. 等 昆 
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虫 的 微 卫星 基于 EST 序列 被 鉴定 出 来 ( 张 琳 琳 等 ， 
2008 ; 刘 玉 娣 和 修成 林 , 2010; FRE, 2010; HFH 
FESE, 2014; 明艳 华 等 , 2015) 。 但 该 方法 获得 的 微 
卫星 大 部 分 位 于 基因 编码 区 ,等 位 基因 数量 少 ,所 开 
发 的 微 卫星 位 点 多 态 性 不 高 ,影响 微 卫 星 的 应 用 。 
基因 组 数据 能 全 面 地 反映 一 个 物种 的 DNA. 在 编码 
区 和 非 编 码 区 内 的 变异 情况 。 在 全 基因 组 水 平 上 ， 
先后 有 冈比亚 按 蚊 、 蜜 蜂 、 二 斑 叶 螨 、 肩 突 硬 蜂 
Ixodes scapularis M&S] Vli Blattella germanica 等 微 
卫星 的 鉴定 和 分 布 规律 研究 报道 (Yu et al., 2005; 
魏 朝 明 等 , 2007; 汪 自 立 等 , 2013; ERS, 2015) 。 
截至 2016 年 4 月 ,NCBI(Chttp ://www. ncbi. nlm. nih. 
govw) 收 录 的 昆虫 微 卫 星 序列 有 21 126 条 ,其 中 蚊 
科 有 1 966 条 。 

中 华 按 蚊 广 泛 分 布 于 西 起 阿富汗 , 东 至 日 本 , 南 
至 印度 尼 西 亚 的 广大 东亚 及 东南 亚 地 区 ,我 国 除 青 
海 和 新 疆 外 的 所 有 省 份 均 有 分 布 ,是 分 布 区 症 疾 和 
丝 虫 病 的 重要 传播 媒介 ( 叶 炳 和 辉 等 , 1981) 。Jung 等 
(2006) 及 Ma 和 Fan (2008 ) 应 用 微 卫星 富 集 文库 
的 方法 分 别 获 得 了 2 个 和 12 个 多 态 性 微 卫 星 位 点 。 
Ma 等 (2011) 运用 5 个 微 卫 星 多 态 位 点 对 中 华 按 蚊 
群体 结构 进行 了 分 析 。 近 年 来 ,我 们 成 功 地 分 离 并 
鉴定 了 21 个 中 华 按 蚊 独特 的 多 态 性 微 卫星 分 子 标 
记 (Bonizzoni et al., 2011) ; 随后 测序 并 分 析 了 中 华 
按 蚊 转 录 组 ,并 对 转录 组 上 的 微 卫 星 作 了 初步 探索 
(Chen et al., 2014)。 目 前 ,在 NCBI 上 已 有 288 条 
中 华 按 蚊 微 卫星 序列 ,但 中 华 按 蚊 全 基因 组 上 的 微 
卫星 及 其 分 布 规律 尚 有 待 全 面 的 研究 。 

近年 来 ,我 们 开展 了 中 华 按 疏 全 基因 组 精细 测 
序 和 注释 工作 。 本 研究 基于 中 华 按 蚊 基 因 组 测序 数 
据 ,在 全 基因 组 水 平 上 全 面 开 展 了 微 卫 星 的 鉴定 工 
作 , 对 微 卫星 长 度 、 数 量 和 碱 基 含 量 的 关系 作 了 分 
析 , 在 基因 组 区 域 ( 基 因 间 隔 区 、 内 含 子 区 和 外 显 子 
区 ) 的 微 卫星 分 布 进行 了 统计 ,并 对 具有 微 卫 星 的 
基因 进行 了 GO( Gene Ontology) 功能 注释 。 这 对 于 
进一步 通过 筛选 微 卫 星 作为 分 子 标 记 开 展 中 华 按 蚊 
种 群 遗传 学 、 遗 传 变异 、 功 能 基因 的 遗传 定位 和 调控 
机 制 研 究 具 有 重要 价值 ,也 为 昆虫 微 卫 星 的 多 样 性 
和 进化 研究 积累 科学 素材 。 


1 材料 与 方法 


1.1 数据 来 源 
中 华 按 蚊 全 基因 组 序列 、 基 因 注 释文 件 和 基因 
































































































































GO 注释 结果 均 来 自重 庆 师 范 大 学 昆虫 与 分 子 生 物 学 
研究 所 ( 待 发表 ) 。 该 基因 组 预测 大 小 为 327 Mb ,装配 
的 总 Scaffold 大 小 为 290 Mb ,大 于 或 等 于 100 bp 的 
Scaffold 序列 有 322 008 条 ,最 长 的 Scaffold 为 41.1 Mb, 
Scaffold N50 为 4.24 Mb, EDS KATERI 98. 9096 。 
1.2 微 卫 星 的 全 基因 组 鉴定 

本 人 研究 运用 MISA (MIcroSAtellite identification 




















tool http ://pgrc. ipkgatersleben. de/misa/misa. html ) 
搜索 工具 ,对 中 华 按 蚊 基 因 组 数据 进行 搜索 及 统计 。 
通过 搜索 工具 MISA 获得 的 位 点 检 出 率 和 准确 度 较 
高 ,结果 统计 信息 丰富 ( 何 旭 东 等 , 2015) ,包括 了 微 
卫星 含量 统计 、 组 成 类 型 长度 以 及 起 始 与 终止 位 置 
等 。 搜 索 标 准 参考 MISA 默认 参数 设置 , 即 1 个 碱 
基 重 复 10 次 及 其 以 上 ;2 个 碱 基 重复 6 次 及 其 以 
上 ;3 个 碱 基 重 复 5 次 及 其 以 上 ;4 个 碱 基 重 复 5 次 
及 其 以 上 ;5 个 碱 基 重复 5 次 及 其 以 上 ;6 个 碱 基 重 
复 5 次 及 其 以 上 ,这 样 的 碱 基 重 复 序列 被 称 为 微 卫 
星 序 列 。 当 两 个 微 卫星 之 间 的 距离 小 于 100 bp 时 ， 
两 个 微 卫 星 就 组 成 了 一 个 复合 型 微 卫 星 ; 当 两 个 微 
卫星 之 间 的 距离 大 于 100 bp 时 , 即 为 两 个 完整 型 微 
卫星 (Wang et al., 2015a) 。 

在 中 华 按 旷 基因 组 DNA 的 2 条 互补 链 上 搜索 
微 卫 星 ,因此 微 卫 星 是 成 对 反 向 互补 的 。 用 微 卫 星 
密度 和 丰 度 来 衡量 微 卫星 出 现 的 频率 ,其 中 ,以 微 卫 
星 出 现 的 总 个 数 /基因 组 数据 大 小 来 表示 微 卫 星 的 
密度 ; 某 一 种 微 卫 星 ( 单 碱 基 ) 出 现 的 数量 /总 的 微 
卫星 数量 表示 微 卫 星 的 丰 度 ( Wang et al., 2015b) 。 
1.3 中华 按 蚊 微 卫星 的 特征 分 析 

中 华 按 蚊 微 卫星 长 度 与 数量 的 关系 : 中 华 按 蚊 
基因 组 微 卫星 的 长 度 [ 碱 基 重 复 单元 与 重复 次 数 的 
乘积 ,如 ( AC)。 长 度 为 2 乘 以 9 等 于 18 bp] 以 每 10 
bp 为 单元 分 为 1 组 ,共计 10 组 ,分 别 为 10 - 20, 
21 -30, 31 -40, 41 -50, 51 - 60, 61 - 70, 71 - 
80,81 —90, 91 — 100 fil z 101 bp (Zhao et al., 
2015), H Excel 2010 统计 每 组 微 卫星 的 数量 ,探寻 
微 卫 星 长 度 与 微 卫星 数量 之 间 的 关系 。 

中 华 按 蚊 基 因 组 微 卫 星 碱 基 含量 分 析 : 微 卫星 
HA, T, C 和 G4 种 碱 基 规 律 性 重复 组 成 ,为 了 探 
明 微 卫星 的 碱 基 含 量 分 布 规律 ,将 AT 碱 基 归 为 一 
类 ,统计 其 AT 含量 , CC 碱 基 归 为 一 类 ,统计 其 GC 
含量 。 运 行 编写 的 perl 脚本 ,分别 对 微 卫 星 的 每 一 
条 序列 计算 其 AT 含量 或 者 GC 含量 ,然后 再 平均 各 
条 微 卫星 序列 的 AT 含量 或 者 GC 含量 
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1.4 微 卫 星 在 全 基因 组 上 的 分 布 

微 卫星 在 基因 间 区 和 基因 区 中 都 有 分 布 。 本 研 
究 结合 MISA 发 现 的 微 卫星 位 置信 息 (misa 文件 ) 和 
本 实验 室 的 基因 组 注释 信息 (GCf 文 件 ,mRNA 区 是 
基因 区 , CDs 区 是 外 显 子 区 , Intron 区 是 内 含 子 区 ) , 
运用 编写 的 perl 脚本 ,将 在 中 华 按 蚊 基 因 间 区 和 基 
因 区 的 微 卫 星 作出 分 类 ,并 对 基因 区 的 外 显 子 区 和 
内 含 子 区 的 微 卫 星 进行 统计 。 输 出 的 结果 以 TXT 
格式 保存 。 
1.5 ”中华 按 蚊 和 冈比亚 按 蚊 含 微 卫 星 的 基因 GO 
注释 比较 

将 上 诉 步 又 1.4 节 所 得 到 的 位 于 基因 区 的 微 卫 
星 对 应 到 相应 的 中 华 按 蚊 基因 上 ,并 提取 相关 基因 
的 GO 注释 号 (功能 注释 结果 提供 自 本 实验 室 )。 用 
同样 的 软件 和 参数 鉴定 冈比亚 按 蚊 基因 组 上 的 微 卫 













































































果 提 交 到 WEGO(http ://wego. genomics. org. cn/ cgi- 
bin/wego/index. pl) 中 作 比 较 分 析 , 使 CO 注释 结果 
更 加 直观 ,便于 对 比 。 





2 结果 


2.1 中 华 按 蚊 全 基因 组 微 卫 星 的 多 样 性 

2.1.1 中 华 按 蚊 全 基因 组 微 卫 星 的 数量 、 密 度 和 丰 
度 : 用 MISA 搜索 到 105 981 个 微 卫 星 序列 ,其 出 现 
的 密度 是 365.5 个 /Mb。 其 中 100 391 个 (94.796) 
是 完整 型 微 卫星 ,其 余 5 590 个 (5.3% ) 是 复合 型 
微 卫 星 。6 种 微 卫 星 中 , 微 卫 星 数量 大 小 和 丰 度 顺 
序 为 单 碱 基 > 二 碱 基 > 三 碱 基 > 四 碱 基 > 五 碱 基 > 
六 碱 基 ( 表 1) 。 单 碱 基 微 卫星 数量 最 多 58 837 个 ， 
占 总 微 卫星 数量 的 (55.5% ) ,密度 最 大 (202.9 个 / 





























星 , 自 Vector Base( https ;//www. vectorbase. org/) 下 
载 浆 比 亚 按 蚊 含 微 卫星 的 基因 的 GO 注释 号 。 把 含 
微 卫 星 的 中 华 按 蚊 和 冈比亚 按 蚊 基因 的 GO 注释 结 





Mb) ;六 碱 基 数量 最 少 (44 个 , 少 于 0.1% ) ,密度 最 
低 (0. 2 个 /Mb )。 单 碱 基 、 二 碱 基 和 三 碱 基数 量 
(104 286 个 ) 占 总 微 卫 星 数量 的 98.4% 。 





表 1 中 华 按 蚊 基因 组 微 卫星 出 现 的 数量 ,密度 和 丰 度 


Table 1 Number, density and abundance of SSRs in Anopheles sinensis genome 


























分 类 依据 向 卫星 类 别 CIUS CE FEC) 密度 (个 /Mb)* 
Classification standard Type of SSRs Number of SSRs Abundance Density 
按 相 邻 微 卫 星 间 的 距离 完整 型 Perfect 100 391 94.7 346.2 
Based on the distance of adjacent SSRs 复合 型 Compound 5 590 543 19.3 
单 碱 基 Mononucleotide 58 837 55.5 202.9 
二 碱 基 Dinucleotide 30 345 28.6 104.6 
" me 三 碱 基 Trinucleotide 15 104 14.3 52.1 
按 碱 基 重 复数 量 , 四 碱 基 Tetranucleotide 1 530 1.4 5.3 
Based on the repeat number of nucleotides iei 
五 碱 基 Penanucleotide 121 0.1 0.4 
六 碱 基 Hexanucletide 44 <0.1 0.2 
微 卫星 总 数 Total 105 981 100 365.5 


























3 丰 度 Abundance; 某 一 类 微 卫 星 数 量 所 占 总 微 卫 星 数 量 的 百分比 Percentage of the number of SSRs of one given category in the total number of 


SSRs; "密度 Density; 平均 每 个 Mb 基因 组 序列 内 微 卫 星 数量 Number of SSRs per Mb genome sequences. 








2.1.2 ”中华 按 蚊 基因 组 不 同类 型 微 卫 星 碱 基 构 成 
的 数量 分 布 :使 用 MISA 默认 参数 搜索 到 中 华 按 蚁 
基因 组 有 2 种 单 碱 基 ,4 种 二 碱 基 ,10 种 三 碱 基 ,32 
种 四 碱 基 ,31 种 五 碱 基 和 22 种 六 碱 基 ( 表 2)。 在 
单 碱 基 、 二 碱 基 三 碱 基 、 四 碱 基 五 碱 和 六 碱 基 中 ， 
(A)n (54 451 ^), (AC) n (22 656), (AGC)n 
(3 673), ( AAAT) n (349) , ( AACCT) n (38) 和 
(AACAGC)n (8) 最多, 分别 占 该 类 型 微 卫 星 的 
92.5% , 74.196 , 24.396 , 22. 896 , 31.496 FI 18.2% 。 
(A)n ( 占 总 微 卫星 数量 的 51.4% ) , (AC)n (21.496) , 
(AG)n (5.796) , (C)n (4.196) , (AGC)n (3.5%), 
(ATC) n (2. 496) , (ACG) n (2. 196) WI (ACC) n 
(1.996 ) 依 次 为 优势 微 卫星 ,数量 都 在 2 000 个 以 














上 , 占 总 微 卫星 数量 的 92.5% 。 

2.2 中华 按 蚊 基 因 组 微 卫 星 特征 分 析 

2.2.1 中 华 按 蚊 微 卫星 长 度 与 数量 的 关系 :在 中 华 
按 蚊 基因 组 微 卫 星 的 长 度 分 组 中 ,以 10 ~20 bp 长 
度 的 微 卫 星 为 主 (87 507 个 ) , 占 总 微 卫 星 数量 的 
87.1% ;21 ~30 bp 长 度 的 微 卫 星 (6 972 个 ) , 占 总 
微 卫星 数量 的 6. 9% ;31 ~ 40 bp 长 度 的 微 卫 星 
(1292 个 ) , 占 总 微 卫 星 数量 的 1.3% ,这 3 类 长 度 
的 微 卫 星 都 主要 是 由 单 碱 基 二 碱 基 三 碱 基 和 四 碱 
基 为 主 (94 569 个 ) , 占 总 数 的 89.2% (图 1)。 其 他 
长 度 分 组 的 微 卫星 数量 甚 少 ,以 复合 形式 的 微 卫星 为 
主 ,各 复合 型 微 卫 星 占 各 自 数 量 的 57.296 ，80. 0% ， 
86.296 , 89.696 , 97.096 , 98.1% 和 97.1%。 
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表 2 中 华 按 蚊 基 因 组 上 不 同类 型 微 卫星 碱 基 构 成 的 数量 分 布 


Table 2 Number distribution of nucleotide compositions of different types of SSRs in Anopheles sinensis genome 


























单 碱 基 (55.5% )* 二 碱 基 (28.6% ) E C14. 396 ) 四 碱 基 (1.4% ) 五 碱 基 (0. 1% ) 六 碱 基 (0. 1% ) 
Mononucleotide Dinucleotide Trinucleotide Tetranucleotide Pentanucleotide Hexanucleotide 
A (54 451 )^ AC (22 656) AGC (3 673) AAAT (349) AACCT (38) AACAGC (8) 
C (4 386) AG (6 058) ATC (2 544) AAAC (243) AAATG (10) AATCCC (5) 
AT (1 136) ACG (2 263) AACG (142) AAAAT (8) AAGATT (3) 
CG (495) ACC (2 056) ATCC (93) AACGT (8) AAAAAT (2) 
AAG (1293) ACGC (90) AAAAC (7) AAAACC (2) 
AAC (1 134) AACC (66) AAATT (6) AAATAC (2) 
AGG (681) ACTG (57) AACTG (6) AAGATG (2) 
ATT (511) AAGT (53) AATGG (5) ACAGGG (2) 
CCG (496) AAGG (40) AATAC (4) ACGAGG (2) 
ACT (453) ACCG (36) AACGG (3) AGCAGG (2) 
AGGG (36) AAAAG (2) AGCATC (2) 
ACAG (34) AAACG (2) AGCTCC (2) 
AAAG (32) AAGAG (2) AAAATT (1) 
AAGC (32) AATTC (2) AAGGAC (1) 
AGCC (32) ACCAG (2) AAGTAC (1) 
ACGG (27) AAACT (1) AATGCG (1) 
AGGC (26) AAAGC (1) ACATAT (1) 
AGCG (23) AAATC (1) ACGAGC (1) 
ACAT (20) AACCG (1) ACGATG (1) 
ATCG (17) AACTT (1) ACTCCG (1) 
AATG (16) AAGAT (1) ACTGGG (1) 
ACTC (15) AATAT (1) AGAGAT (1) 
AATC (13) AATCC (1) 
AGAT (11) AATGC (1) 
AATT (7) ACATC (1) 
ACCT (6) ACATG (1) 
ACCC (4) ACCTC (1) 
AACT (3) ACGGG (1) 
ACGT (3) AGGAT (1) 
CCCG (2) ATCCC (1) 
ATGC (1) ATCGC (1) 
CCGG (1) 


* 括 号 内 百分比 指 不 同类 型 微 卫 星 所 占 比 例 The percentage in brackets represents the proportion of different types of SSRs; "括号 内 数字 指 该 微 卫星 


数量 The numeral in brackets represents the number of given SSRs. 
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图 1 ”中华 按 蚊 基 因 组 微 卫星 不 同 长 度 的 数量 分 布 
Fig. 1 Number distribution of different lengths of SSRs in Anopheles sinensis genome 
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2.2.2 ”中华 按 蚁 基因 组 微 卫星 碱 基 含 量 分 析 : 对 中 
华 按 蚊 基 因 组 微 卫 星 AT 含量 和 GC 含量 分 析 表 明 ， 
AT 含量 (63% ) 明显 高 于 GC 含量 (37% ) 。 在 6 种 
微 卫 星 类 型 中 , 仪 有 三 碱 基 微 卫星 的 GC 含量 

1.0 —6— GC 含量 GC-content 











MEAR 
Base content 


重复 类 型 


(5396 ) 略 高 于 AT 含量 (47% ) , 单 碱 基 微 卫星 的 AT 
含量 最 高 (93% ) , 其 次 是 五 碱 基 (68% ) P pk AE 
(63%)、 六 碱 基 (57%) 和 二 碱 基 微 卫星 (519 ) 
(图 2)。 


一 9 一 AT 含 量 AT-content 








|! Repeat type 











图 2 





中 华 按 蚊 基 因 组 不 同类 型 微 卫 星 碱 基 含 量 分 布 





Fig. 2 Distribution of base contents of different types of SSRs in Anopheles sinensis genome 


2.3 ”中华 按 蚊 全 基因 组 微 卫 星 在 不 同 基因 区 的 数 
量 分 布 

中 华 按 蚊 基 因 组 微 卫星 在 基因 间 区 和 基因 区 的 
分 布 研究 表明 ,90 632 个 微 卫 星 ( 占 总 数 的 85% ) 分 
布 在 基因 间 区 ,15 349 个 微 卫星 (15% ) 分 布 在 基因 
区 (图 3)。 在 基因 区 ,2 782 个 微 卫星 (3% ) 分 布 在 
外 显 子 区 ,12 567 个 微 卫星 (12% ) 分 布 在 内 含 子 
区 。 对 分 布 于 基因 区 的 15 349 个 微 卫 星 的 类 型 分 
HRH, 单 碱 基 微 卫星 数量 最 多 (6 757 个 , h 
44.096) ,其 次 是 三 碱 基 (4 238,27. 696) Z m AE 
(3 245 ,21.1% ) 四 碱 基 (209 ,1.4% ) 五 碱 基 (16， 
0. 196 ) 和 六 碱 基 微 卫星 (10,0.1% ) (图 4: A)。 在 
基因 区 的 三 碱 基 微 卫星 的 比例 (27.6% ) 明显 高 于 
整个 基因 组 中 三 碱 基 微 卫星 比例 (14. 3% ) 。 进 一 
步 分 析 外 显 子 区 的 微 卫 星 发 现 ,其 中 2 453 个 微 卫 
星 (88.2% ) 都 是 三 碱 基 微 卫星 ,其 他 类 型 的 微 卫 星 

A 

















碱 基 Hexanucleotide 

五 碱 基 Pentanucleotide In 

四 碱 基 Tetranucleotide s 
三 碱 基 Trinucleotide | 

R 二 碱 基 Dinucleotide | 

(=| 单 碱 基 Mononucleotide A 


> 








Repeat type 








微 卫星 数量 Number of SSRs 





0 1000 2000 3000 4000 5000 6000 7000 


所 占 比例 甚 小 ,五 碱 基 微 卫 星 甚 至 为 零 (图 4: B) 。 


内 含 子 Intron 
12 567 (12%) 





外 显 子 Exon 
2.782 (396) 





基因 间 区 Intergenic region 
90 632 (8596) 


图 3 ”中华 按 蚊 微 卫星 在 基因 组 不 同 区 域 的 数量 和 比例 
Fig. 3 














Numbers and proportions of SSRs in different regions 


of Anophles sinensis genome 
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Ed 4 中华 按 蚊 基因 区 内 不 同类 型 微 卫 星 的 数量 分 布 


Fig. 4 Number distribution of different types of SSRs in gene regions of Anoheles sinensis genome 
A: 基因 区 Gene region; B; 外 显 子 区 Exon region. 
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2.4 中 华 按 蚊 和 冈比亚 按 蚊 含 微 卫星 的 基因 GO 
注释 比较 

为 探究 含 微 卫 星 的 基因 的 功能 专 化 性 及 在 近 缘 
种 间 的 差异 性 ,我 们 对 中 华 按 蚊 和 冈比亚 按 蚊 5 718 
个 和 6 136 个 含 微 卫 星 的 基因 作 了 GO 功能 注释 和 
比较 ,结果 分 别 有 3 144 和 4 397 获得 了 功能 注释 
(图 5)。 在 细胞 成 分 (cellular component) ,分 子 功 能 
(molecular function) 和 生物 过 程 (biological process) 
三 大 类 中 ,这 两 个 物种 各 小 类 基因 所 占 总 基因 数 的 
百分比 基本 一 致 ,但 分 子 功能 类 别 中 的 电子 传递 类 
(electron. carrier) 基因 在 中 华 按 蚊 所 占 百 分 比 
(0.9% ) 明显 高 于 冈比亚 按 蚊 (0. 1% ) ,分 子 功 能 ; 
别 中 的 翻译 调控 (translation regulator)、 生 物 过 程 类 








WEGO output 





Wi 4n. sinensis Bi 4n. gambiae 


基因 百分比 
Percent of genes 


Molecular Function 
分 子 功 能 


Cellular Component 


细胞 成 分 











别 中 解 I 结 构 的 形 成 ( anatomical structure 
formation ) 、 细 胞 成 分 的 生物 合成 (cellular component 
biogenesis )、 细 胞 组 成 组 织 (cellular component 
organization )、 生 殖 ( reproduction ) 和 生殖 过 程 
( reproductive process ) 在 冈比亚 按 蚊 的 比例 明显 高 
于 中 华 按 蚊 。 此 外 ,中 华 按 蚊 在 细胞 成 分 中 的 病毒 
(virion ) 和 病毒 体 (virion part) ;分 子 功能 中 的 辅助 
运输 蛋白 (auxiliary transport protein ) 和 和 蛋白 标签 
(protein tag) ;生物 过 程 中 的 细胞 杀伤 (cell killing) 、 
$ z) (locomotion ) 、 多 有 机 体 过 程 ( multi-organism 
process ) 和 节律 过 程 (rhythmic process ) 类 基因 中 不 
具 微 卫星 ,但 在 冈比亚 按 蚊 的 这 些 类 别 的 基因 中 有 
一 部 分 具有 微 卫星 。 








Number of genes 
基因 数 


Biological Process 


生物 过 程 


图 5 ”中华 按 蚊 和 冈比亚 按 蚊 基因 组 中 含 微 卫星 的 基因 GO 分 类 








Fig. 5 GO classification of SSR-containing genes in Anopheles sinensis and An. gambiae genomes 


比较 分 析 中 华 按 蚊 和 冈比亚 按 蚊 含 微 卫 星 的 电 
子 传递 基因 发 现 ,中 华 按 蚊 的 电子 传递 基因 共有 28 
个 ,其 中 22 个 属于 P450 家 族 ,其 余 6 个 包括 琵 珀 酸 
脱氧 酶 铁 硫 亚 基 基因 、 黄 嗓 叭 脱氧 酶 基因 、 双 氧化 酶 
基因 蛋白质 二 硫 键 异 构 酶 AT 基因 、 和 蛋白 质 二 硫 键 
异 构 酶 A3 基因 和 1 个 功能 未 知 基因 ( 表 3)。 而 冈 
比 亚 按 蚊 含 微 卫星 的 电子 传递 基因 仅 有 6 个 ,其 中 
5 个 分 别 是 琥珀 酸 脱氧 酶 铁 硫 亚 基 基因 、 乙 醛 氧化 
酶 基因 线粒体 细胞 色素 cl 血红 素 蛋 白 基 因 、 细 胞 
色素 b 基因 和 细胞 色素 c 基因 , 另外 1 个 为 功能 未 
知 基 因 。 


3 讨论 


中 华 按 蚊 基因 组 中 单 碱 基 微 卫星 最 多 ( 占 总 数 
的 55. 5% ) , 其 次 为 二 碱 基 (28. 6%)、 三 碱 基 
(14. 396 ) 和 四 碱 基 (1.4% ) ,五 碱 基 (0.1% ) 和 六 碱 
基 (0. 196) 最 少 。 在 已 有 节肢 动物 报道 中 , 肩 突 便 
MPCTE H x. 5$, 2013) 单 碱 基 微 卫星 最 多 
(73.74% ) ,蜜蜂 ( 魏 朝 明和 等, 2007 ) 以 二 碱 基 微 卫 
星 最 多 (26. 86% ) , 而 二 斑 叶 螨 ( 汪 自立 等 , 2013 ) 
(72.83% ) fü f Es] /] NE ( 王 晨 等 , 2015) (37.5496) 
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RI 中华 按 蚊 和 冈比亚 按 蚊 基 因 组 含 微 卫 星 且 具 电 子 传 递 基因 的 比较 


Table 3 Comparison of the SSR-containing and electron transport genes in Anopheles sinensis and An. gambiae genomes 


中 华 按 蚊 An. sinensis 





内 比 亚 按 蚊 An. gambiae 

















Gene name 





ASDB 登录 号 ” 


ASDB accession no. 


Containing SSRs or not GenBank accession no. 


含 SSRs 或 不 含 GenBank 登录 号 含 SSRs 或 不 含 


Containing SSRs or not 























理 珀 酸 脱 氧 酶 铁 硫 亚 基 基因 


Succinate dehydrogenase ( ubiquinone) 











Sinensis_CLEAN_10006458 


iron-sulfur subunit gene 
未 知 基 因 Unkown gene 
黄 嗓 叭 脱氧 酶 基因 
Xanthine dehydrogenase gene 
双 氧 化 酶 基因 Dual oxidase gene 
和 蛋白质 二 硫 键 异 构 酶 Al 基因 
Protein disulfide-isomerase Al gene 


和 蛋白质 二 硫 键 异 构 酶 A3 基因 


Protein disulfide isomerase 


" 


Sinensis. GLEAN, 10002382 























Sinensis. GLEAN, 10006954 
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Sinensis. GLEAN, 10007831 








Sinensis. GLEAN, 10012252 

















Sinensis GLEAN 10004198 
family A, member 3 gene 
Sinensis GLEAN 10001812 
Sinensis GLEAN 10004651 
Sinensis GLEAN 10004654 
Sinensis GLEAN 10007386 
Sinensis GLEAN 10008091 
Sinensis GLEAN 10012640 
Sinensis GLEAN 10013088 
Sinensis GLEAN 10013294 
Sinensis GLEAN 10013420 
Sinensis GLEAN 10013739 
Sinensis GLEAN 10013740 
Sinensis GLEAN 10013742 
Sinensis GLEAN 10014220 
Sinensis GLEAN 10014378 
Sinensis GLEAN 10014379 
Sinensis GLEAN 10016171 
Sinensis GLEAN 10017142 
Sinensis GLEAN 10017143 
Sinensis GLEAN 10010680 
Sinensis GLEAN 10012625 
Sinensis GLEAN 10017126 
Sinensis GLEAN 10004172 





细胞 色素 PASO 基因 
Cytochrome P450 genes 





线粒体 细胞 色素 cl 血红 素 蛋 白 基 因 


Mitochondrial cytochrome cl 








Sinensis_CLEAN_10004860 


heme protein gene 
细胞 色素 b 基因 Cytochrome b gene 
细胞 色素 c 基因 Cytochrome c gene 
*ASDB 登录 号 来 


无 None 
Sinensis_CLEAN_10006889 


























则 以 三 碱 基 为 主 。 这 表明 主要 微 卫 星 类 别 在 不 同 物 
种 中 存在 明显 差异 ,但 整体 看 来 ,昆虫 全 基因 组 上 微 
卫星 以 单 碱 基 、 二 碱 基 或 三 碱 基 为 主 。 在 所 有 不 同 
碱 基 类 型 中 ,中 华 按 蚊 基 因 组 优势 微 卫 星 依次 为 
(A)n, (AC)n, (AG)n, (C)n, (AGC)n, (ATC) 
n, (ACG)n 和 (ACC)n。 二 斑 叶 螨 和 肩 突 硬 蝗 优 势 
微 卫星 依次 为 (A)n, (AG)n, (TG)n, (GAT)n, 
(ATTT)n 和 (AATA)n( 汪 自立 等 ,2013), 蜜 蜂 为 
(A)n, (AG)n, (AAT)n, (AAAG)n 和 ( AAAAG)n 




















E Yes AGAP007309 fà Yes 
E Yes AGAPO000262 fà Yes 
E Yes AGAP007918 不 含 No 
含 Yes AGAPO008072 不 含 No 
含 Yes AGAP012407 不 含 No 
含 Yes AGAP007393 不 含 No 
含 Yes AGAP007480 不 含 No 
含 Yes AGAP000285 不 含 No 
含 Yes AGAPO000284 不 含 No 
含 Yes AGAPO006047 不 含 No 
含 Yes AGAP010961 不 含 No 
含 Yes AGAP008219 不 含 No 
含 Yes AGAP010077 不 含 No 
含 Yes AGAP001076 不 含 No 
含 Yes AGAPO00088 不 含 No 
含 Yes AGAPO000194 不 含 No 
含 Yes AGAP010414 不 含 No 
含 Yes AGAP000192 不 含 No 
含 Yes AGAPO003066 不 含 No 
含 Yes AGAP002195 不 含 No 
含 Yes AGAP002197 不 含 No 
含 Yes AGAPO013511 不 含 No 
含 Yes AGAPO002418 不 含 No 
含 Yes AGAP002417 不 含 No 
含 Yes AGAP005774 不 含 No 
含 Yes AGAPO008204 不 含 No 
含 Yes AGAP002429 不 含 No 
fà Yes 无 None 不 含 No 
不 含 No AGAP006936 fà Yes 
不 含 No AGAP028387 fà Yes 
不 含 No AGAP009537 含 Yes 


网 址 219.221. 10.82。ASDB accession no. can track from website 219. 221. 10. 82. 

















( 魏 朝 明 等 ,2007) , $8 E] / NET (A) n, CAT) n, 
CAAT) n FRICAAAT) nC EJ SE, 2015) ,表明 昆虫 基 
因 组 的 优势 微 卫 星 也 存在 一 定 的 物种 差异 性 ,但 
(A) n 是 所 有 这 些 种 中 最 优势 的 微 卫 星 序 列 。 

在 中 华 按 蚊 基 因 组 微 卫星 中 , 微 卫 星 的 长 度 以 
10 ~20 bp 为 主 , 占 总 微 卫 星 数量 的 87. 1% ,而 长 于 
20 bp 的 微 卫 星 只 有 22. 9% 。 在 已 报道 的 油茶 
Camellia spp. ( E ṣi Œ, 2012) (88. 396) 和 人 竹子 
( Bambusoideae) ( Zhao et al., 2015) (8596 ) 全 基因 
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组 中 同样 以 10 ~20 bp 长 度 的 微 卫 星 为 主 。 早 前 的 
研究 将 微 卫星 长 度 分 为 两 类 ,把 长 于 20 bp 的 微 卫 
星 分 为 一 类 ,小 于 或 等 于 20 bp 的 微 卫 星 分 为 另 一 
类 。 认 为 长 于 20 bp 的 微 卫星 更 为 活路 ,位 点 多 态 








主要 分 布 在 基因 间 区 是 动 植物 的 普遍 特性 ,这 可 能 
是 基因 间 区 的 序列 远 长 于 基因 区 所 致 。 尽 管 基因 区 
微 卫 星 所 占 比 例 并 不 大 ,但 是 位 于 内 含 子 或 外 显 子 
区 的 微 卫星 一 旦 发 生变 蜡 , 则 对 物种 产生 的 影响 要 




















性 高 ,变异 速率 快 ,所 受到 的 选择 压力 大 ,存在 时 间 
kd ,易于 变 为 较 短 的 微 卫 星 ;小 于 或 等 于 20 bp 的 微 
卫星 相对 稳定 ,是 更 为 理想 的 用 于 遗传 研究 的 微 卫 
星 标 记 (Weber，1990; Cho et al., 2000; Harr and 
Schlotterer, 2000; Temnykh et al., 2000; Temnykh et 
al., 2001) 。 基 于 已 有 的 研究 ,基因 组 微 卫星 长 度 主 
要 分 布 在 10 -20 bp ,这 是 微 卫星 自身 的 功能 特点 所 
决定 的 ,其 与 物种 之 间 的 关系 还 有 待 更 多 研究 和 
总 结 。 

中 华 按 蚊 基 因 组 微 卫 星 AT 含量 高 于 GC 含量 ， 
只 有 三 碱 基 微 卫星 的 GC 含量 略 高 于 AT 含量 。 这 
Ej H Æ 3E xq HR Marsupenaeus japonicas ( 28 ^E SE, 
2007). A Homo sapiens (Li et al., 2004) , ^F. Bos 
taurus 亚洲 水 牛 Bubalus bubalis ,' 犀牛 Bos mutus , 2i 
Æ Ovis aries, M] Æ Capra hircus, FI JA, 3k FS Æ 
Pantholops hodgsonii (Qi et al., 2015) 基因 组 上 微 卫 
E AT 含量 相似 。 微 卫星 AT 含量 高 的 原因 是 由 于 
AT 含量 高 , Tm 值 小 ,在 DNA 复制 滑动 和 重组 时 
DNA 链 易 解 开 , 这样 产生 A/T 重复 类 型 的 概率 就 
大 。 而 三 碱 基 的 GC 含量 多 于 AT 含量 可 能 是 密码 
子 同 是 3 个 碱 基 组 成 ,GC 含量 高 ,使 物种 更 加 趋 于 
稳定 。 尽 管 GC 含量 在 基因 组 微 卫 星 中 不 如 AT E 
富 ,但 是 Schorderet 和 Gartler ( 1992 ) 人 研究 表明 ,GC 
含量 在 整个 基因 组 中 起 着 重要 的 作用 。 例 如 
Griffiths (2006) 发 现 , 胸 昔 激酶 (TIK) 的 (C)n 突变 
参与 单纯 疱疹 病毒 的 再 活化 ,肺炎 衣原体 膜 蛋白 基 
pmplO 的 (G)n 重复 序列 参与 衣原体 病毒 发 病 机 
iij ( Grimwood et al., 2001) 。 对 三 碱 基 中 GC 含量 高 
的 微 卫 星 研 究 有 利于 揭 开 微 卫星 功能 的 秘密 。 

中 华 按 蚊 基因 组 微 卫星 主要 分 布 在 基因 间 区 
(8596) ,只 有 少量 分 布 在 基因 区 (15% ) , 而 基因 区 
中 微 卫星 更 加 倾向 于 分 布 在 内 含 子 区 (12% ) ,外 显 
子 区 的 微 卫星 相对 甚 少 (3% ) 。 在 已 报道 的 昆虫 
中 ,德国 小 蚁 基因 间 区 微 卫 星 更 是 占 了 总 微 卫 星 数 
量 的 90.23% ,而 内 含 子 微 卫星 也 达到 了 9.3696 (E. 
展 等 , 2015 ) 。 在 植物 中 已 报道 的 毛竹 Phyllostachys 
edulis, E X Zea mays, 水 fü Oryza sativa, 高 梁 
Sorghum bicolor -FEAA Brachypodium distachyon 
和 拟 南 芥 Arabidopsis thaliana 同样 以 基因 间 区 ( > 
50% ) 微 卫星 较为 多 见 (Zhao et al., 2015) 。 微 卫星 

















































































































远 远大 于 位 于 基因 间 区 的 微 卫 星 变异 。 内 含 子 区 的 
微 卫 星 能 影响 基因 的 转录 和 表达 ,也 能 调节 mRNA 
的 拼接 。Gabellini(2001) 研 究 发 现 , 人 Na* /Ca 3€ 
换 基因 (NCX 1) 的 第 二 个 内 含 子 中 包含 (GT)n 重复 
类 型 , 当 n =10 ~16 时 , 则 会 增强 序列 的 拼接 。 外 显 
子 区 微 卫星 的 扩张 或 收缩 都 将 直接 影响 着 相应 基因 
的 表达 ,造成 表 型 差异 。 脆 性 X 综合 征 ( fragile X 
syndrome ) 的 遗传 机 制 就 是 由 位 于 X 染色 体 FMRI 
基因 的 第 一 个 外 显 子 内 (CGG)n 重复 序列 异常 扩 增 
而 致 (Carber et al., 2008)。 这 似乎 也 是 中 华 按 蚊 外 
显 子 区 内 以 三 碱 基 微 卫星 为 主 的 一 个 重要 原因 , 密 
人 码 子 与 三 碱 基 微 卫星 同 是 3 个 碱 基 组 成 ,有 利于 物 
种 稳定 。 张 琳 琳 (2008 ) 研究 表明 ,编码 区 的 微 卫星 
并 不 是 移 码 突变 而 是 物种 内 的 选择 所 致 。 

对 中 华 按 蚊 和 冈比亚 按 蚊 含 微 卫 星 的 基因 GO 
注释 比较 发 现 ,这 两 个 物种 各 小 类 基因 所 占 总 基因 
数 的 百分比 基本 一 致 ,说 明 微 卫星 在 近 缘 物种 中 的 
功能 和 作用 是 基本 相似 的 。 两 者 的 细微 差别 可 以 
看 ,出 微 卫星 在 近 缘 物种 基因 中 的 分 布 仍然 存在 一 
定 差别 ,这 或 许 与 中 华 按 蚊 分 布 在 亚洲 ,冈比亚 按 蚊 
分 布 在 非洲 有 一 定 的 关联 。jJiang 等 (2014) 在 研究 
海洋 动物 基因 组 微 卫 星 时 , 比较 保 礁 海绵 
和 X d 胆 
Strongylocentrotus purpuratus 共同 微 卫 星 (ATGTAC)n 
所 在 基因 GO 功能 注释 发 现 , 微 卫 星 (ATGTAC)n 可 
能 参与 了 海洋 动物 的 进化 历程 。 进 而 ,继续 对 电子 
传递 具 微 卫星 的 基因 总 结 发 现 , 中华 按 蚊 是 冈比亚 
按 蚊 的 将 近 5 倍 之 多 ,而 且 其 中 的 78.6% 属 于 P450 
家 族 。 然 而 是 何 种 原因 导致 这 样 的 现象 还 不 得 而 
知 , 需 要 后 续 对 更 多 蚊虫 的 比较 基因 组 研究 来 揭示 
蚊虫 中 含 微 卫星 相关 基因 的 差别 。 

随 着 大 数据 时 代 的 到 来 , 越 来 越 多 的 昆虫 基因 
组 得 以 测序 。 本 研究 对 中 华 按 蚊 基 因 组 微 卫 星 的 鉴 
定 和 特征 分 析 为 中 华 按 疏 的 遗传 相关 研究 的 分 子 标 
记 选 择 黄 定 了 基础 ,也 为 其 他 昆虫 基因 组 微 卫 星 鉴 
定 和 比较 研究 提供 了 方法 基础 。 


















































Amphimedon queenslandica 
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